5.SDF Mesh表达

SDF Mesh 一、动机与背景抱歉，您的浏览器不支持内嵌视频。实时渲染（例如 UE5 的 Lumen）把性能与真实感推到了新的高度。其中，SDF（有向距离场）因求交高效、表达统一，被广泛用于描述与追踪几何体。但传统 SDF 多依赖解析式（球、盒等），遇到复杂形状就会受限。受 Lumen 启发，我们把任意网格（Mesh）预烘焙成 SDF，在光线步进（Ray Marching）中像采样贴图一样使用它。这正是本文的 SDF Mesh：先把模型的距离场写入三维纹理（3D/Volume Texture），渲染时直接采样，得到任意点到表面的距离。如下是效果图：二、理解SDF数据结构在我们深入代码之前，首先需要理解SDF Mesh的数据是如何组织的。这通常是一个自定义的二进制或文本文件，包含了重建SDF场景所需的所有元数据。以我们项目中使用的 .sdf 文件为例，其结构非常直观： 27 17 15 -0.13 -0.08 -0.04 0.01 ... -0.015 -0.005 0.005 0.015 ... 各行含义如下：第1行：体素分辨率 (Resolution) 27 17 15 表示这个SDF数据场在X, Y, Z三个轴向上被划分成了 $27 \times 17 \times 15$ 个网格单元（Voxel）。分辨率越高，细节越丰富，但文件也越大。第2行：空间原点 (Origin) -0.13 -0.08 -0.04 定义了这个三维网格在模型局部空间中的起始坐标。它像是整个数据场的“锚点”。第3行：体素尺寸 (Voxel Size / Precision) 0.01 定义了每个小格子的边长。这个值至关重要，它将无单位的格子索引与真实的空间尺度关联起来。第4行及以后：距离场数据 (Distance Field Data) 从这里开始，文件逐行列出每个网格顶点的SDF值。这些浮点数遵循SDF的经典定义：负数：该点位于物体内部。正数：该点位于物体外部。零：该点恰好位于物体表面。在加载阶段，我们会解析这个文件，将元数据（分辨率、原点、尺寸）保存起来，并将所有的距离数据上传到GPU，形成一个3D纹理，也就是我们Shader中将要采样的 sampler3D 对象。补充说明：分辨率与 cellSize 决定了体素网格的物理尺度；origin 表示该网格在模型局部空间中的起点坐标。当前实现主要以包围盒 meshHalfSize 为基准做归一化映射；若需要引入 origin，可在着色器中先对 local 做平移，再进行 local / halfSize 的归一化。三、从空间点到SDF采样接下来一个核心问题是：在 Shader 中，给定任意一个世界空间点 $p$，如何从三维纹理中查询对应的 SDF 值？这个核心任务由 sdfMeshShape 函数完成。它的职责明确：接收一个世界空间点 $p$ ，返回该点到SDF网格物体表面的最短有向距离。 3.1 核心函数 sdfMeshShape // 采样SDF网格并将其约束在包围盒内 float sdfMeshShape(vec3 p) { // 步骤 1: 坐标系转换 (世界空间 -> 模型局部空间) mat3 rot = rotateX(u.sphereRotation.x) * rotateY(u.sphereRotation.y) * rotateZ(u.sphereRotation.z); vec3 local = transpose(rot) * p; // 步骤 2: 计算点到包围盒的距离 vec3 halfSize = u.meshHalfSize.xyz; float boxSdf = sdBox(local, halfSize); // 步骤 3: 将局部空间坐标映射为3D纹理坐标 (UVW) vec3 uvw = clamp(local / max(halfSize, vec3(1e-5)) * 0.5 + 0.5, 0.0, 1.0); // 步骤 4: 从3D纹理中采样SDF值并与包围盒组合 float scaleMin = u.sdfParams0.x; float hasTex = u.sdfParams0.y; float dMesh = boxSdf; if (hasTex > 0.5) { float dTex = texture(sdfTex, uvw).r; // 采样 dMesh = max(dTex * scaleMin, boxSdf); // 组合 } return dMesh; } 3.2 算法步骤详解步骤 1: 坐标系转换 (世界空间 $\rightarrow$ 模型局部空间) SDF纹理是在模型的局部空间（Model Space）下生成的，它不关心模型在世界中的位置和旋转。因此，采样的第一步，就是将世界空间的查询点 $p$ 转换回模型的局部空间。 mat3 rot = rotateX(u.sphereRotation.x) * rotateY(u.sphereRotation.y) * rotateZ(u.sphereRotation.z); vec3 local = transpose(rot) * p; 这里直接使用旋转矩阵的转置。对正交矩阵（包含旋转）而言，逆矩阵等于转置矩阵。这样就能快速抵消世界空间下的旋转，得到局部空间坐标 local。步骤 2: 计算包围盒SDF 3D纹理本身是无边界的，我们需要一个“容器”来约束它。一个简单的轴对齐包围盒（AABB）是理想的选择。 vec3 halfSize = u.meshHalfSize.xyz; float boxSdf = sdBox(local, halfSize); boxSdf 计算了局部点 local 到这个包围盒的距离。它有两个作用：基础形状：如果SDF纹理未启用，物体就表现为一个简单的盒子。裁剪边界：确保最终的SDF形状不会超出这个盒子的范围。步骤 3: 局部空间坐标到纹理坐标(UVW)的映射这是整个流程的枢纽。我们需要将局部空间坐标 local 转换成用于纹理采样的、范围在 $[0, 1]$ 内的UVW坐标。 vec3 uvw = clamp(local / max(halfSize, vec3(1e-5)) * 0.5 + 0.5, 0.0, 1.0); 这行代码做了三件事：归一化: local / halfSize 将局部坐标从 $[-halfSize, +halfSize]$ 范围映射到 $[-1, 1]$ 范围。数学上：$P_{norm} = (\frac{local.x}{halfSize.x}, \frac{local.y}{halfSize.y}, \frac{local.z}{halfSize.z})$ 重映射: ... * 0.5 + 0.5 将 $[-1, 1]$ 范围线性映射到 $[0, 1]$ 的标准纹理坐标范围。数学上：$P_{uvw} = P_{norm} \times 0.5 + 0.5$ 钳制: clamp(..., 0.0, 1.0) 一个安全措施，确保任何因浮点误差或处于盒子外部的点所计算出的坐标都能被强制拉回有效的 $[0, 1]$ 范围，避免采样越界。步骤 4: 采样、缩放与组合最后一步，我们使用计算出的 uvw 坐标进行采样，并与包围盒进行组合。 float dTex = texture(sdfTex, uvw).r; dMesh = max(dTex * scaleMin, boxSdf); 这里有两个关键点：距离缩放 (dTex * scaleMin): 3D纹理中存储的SDF值 dTex 通常是归一化的。scaleMin 参数作为一个从CPU传入的缩放因子，负责将这个无单位的相对距离值，转换为与场景尺度匹配的真实世界距离。这使得同一个SDF资产可以在场景中以不同的大小复用。我们将在后文详细探讨这一点。几何组合 (max(A, B)): 在SDF的布尔运算中，max(sdfA, sdfB) 代表两个形状的交集 (Intersection)。这里的 max(scaledDistance, boxSdf) 意味着最终的形状是“SDF纹理定义的形状”与“包围盒定义的形状”的交集。这巧妙地将复杂的SDF几何体裁剪并约束在了包围盒的内部。四、性能优化与思考在步进循环中，sdfMeshShape 会被反复调用，代价敏感。一个低成本的改进是：只有当查询点落在包围盒内部时，才进行 3D 纹理采样。 4.1 冗余计算分析若点在盒子外（boxSdf > 0），最短距离就是到盒面的距离。此时再去计算 uvw 并采样 3D 纹理基本无助于结果，只会浪费带宽与算力。 4.2 引入分支进行优化我们可以通过一个简单的条件分支来避免这种冗余：优化后的 sdfMeshShape 函数: float sdfMeshShape_Optimized(vec3 p) { // ... (步骤1: 坐标转换) vec3 local = ...; // ... (步骤2: 计算包围盒SDF) vec3 halfSize = u.meshHalfSize.xyz; float boxSdf = sdBox(local, halfSize); // 【核心优化】 // 如果点在包围盒外部，提前返回，避免不必要的计算 if (boxSdf > 0.0) { return boxSdf; } // --- 仅当点在包围盒内部或表面时，才执行以下代码 --- if (u.sdfParams0.y > 0.5) { // hasTex vec3 uvw = clamp(local / max(halfSize, vec3(1e-5)) * 0.5 + 0.5, 0.0, 1.0); float dTex = texture(sdfTex, uvw).r; return max(dTex * u.sdfParams0.x, boxSdf); // u.sdfParams0.x is scaleMin } return boxSdf; } 4.3 分支的利弊权衡 (The Trade-off) 在GPU编程中，引入分支需要警惕线程束发散 (Warp Divergence)。优点: 当SDF物体在屏幕上占比较小时，绝大多数像素/光线都会在 if (boxSdf > 0.0) 处被提前剔除，极大地节省了纹理带宽和计算开销，性能提升显著。缺点: 当大量像素/光线恰好落在包围盒的边界时，一个线程束（Warp）内的线程可能会进入不同的分支路径，导致硬件需要串行执行两个分支，反而会降低性能。不过，在光线步进这类应用中，光线从远处逼近物体，绝大多数步进点都处于物体之外。因此，这种提前退出（Early Exit）的优化策略通常是利大于弊的。五、自由三维缩放在本项目中，SDF 网格的“大小”和“非均匀缩放”由一个简单直观的包围盒参数 u.meshHalfSize.xyz 控制。它表示模型局部空间中包围盒在 X、Y、Z 方向上的“半长度”（Half Size）。回看前文 Shader 的核心采样映射： vec3 halfSize = u.meshHalfSize.xyz; vec3 uvw = clamp(local / max(halfSize, vec3(1e-5)) * 0.5 + 0.5, 0.0, 1.0); 这意味着：设定半尺寸：若希望最终渲染物体的世界尺寸为 (L \times H \times W)，则将 u.meshHalfSize 设为 ((L/2, H/2, W/2))。非均匀缩放天然支持：halfSize.x/y/z 可以分别不同，从而在三个轴向上独立缩放。数值稳定性：使用 max(halfSize, 1e-5) 与 UI 侧的最小值钳制，避免除零与极小尺寸导致的不稳定。 5.1 运行时如何驱动 meshHalfSize（UI 与 UBO）界面侧通过 ImGui 提供了一个三维尺寸滑条（长度/高度/宽度），直接对应到 boxSizeLWH： ImGui::Text("Box Size (L/W/H)"); // Length->X, Width->Z, Height->Y ImGui::SliderFloat3("L/W/H", boxSizeLWH, 0.2f, 6.0f, "%.2f"); if (ImGui::Button("Reset Size")) { boxSizeLWH[0]=2.4f; boxSizeLWH[1]=2.4f; boxSizeLWH[2]=2.4f; } 随后在更新 UBO 的阶段将其转换为 meshHalfSize（注意最小值钳制与轴向映射）： // Use the user-controlled box as the bounding box for the SDF mesh float halfX = std::max(0.05f, boxSizeLWH[0] * 0.5f); // Length -> X float halfY = std::max(0.05f, boxSizeLWH[1] * 0.5f); // Height -> Y float halfZ = std::max(0.05f, boxSizeLWH[2] * 0.5f); // Width -> Z u.meshHalfSize[0] = halfX; u.meshHalfSize[1] = halfY; u.meshHalfSize[2] = halfZ; u.meshHalfSize[3] = 0.0f; 由此，Shader 中 local / halfSize 的归一化会把 SDF 网格“挤压/拉伸”到这个包围盒内，从而实现可视上对物体的自由三维缩放。 5.2 与距离缩放（scaleMin）的关系当进行非均匀缩放时，为了保证光线步进的稳定性与保守性，CPU 侧会根据“原始 SDF 体素物理尺寸”和“目标包围盒尺寸”的比值，计算一个最小轴向缩放 scaleMin 并传入 u.sdfParams0.x： float origLenX = sdfData.width * sdfData.cellSize; float origLenY = sdfData.height * sdfData.cellSize; float origLenZ = sdfData.depth * sdfData.cellSize; float boxLenX = 2.0f * halfX; float boxLenY = 2.0f * halfY; float boxLenZ = 2.0f * halfZ; float sx = (origLenX > 1e-6f) ? (boxLenX / origLenX) : 1.0f; float sy = (origLenY > 1e-6f) ? (boxLenY / origLenY) : 1.0f; float sz = (origLenZ > 1e-6f) ? (boxLenZ / origLenZ) : 1.0f; float scaleMin = std::min(sx, std::min(sy, sz)); u.sdfParams0[0] = scaleMin; // 距离缩放（用于 Shader 中 dTex * scaleMin） u.sdfParams0[1] = (sdfMeshTextureView != VK_NULL_HANDLE) ? 1.0f : 0.0f; // hasTex 直观理解：meshHalfSize 决定“几何体外形/体积”的缩放；scaleMin 决定“光线步进距离”的保守缩放。非均匀缩放下我们选取最小轴向比例，避免步长过大导致穿透。 Shader 侧组合： float dTex = texture(sdfTex, uvw).r; float dMesh = max(dTex * u.sdfParams0.x /*scaleMin*/, boxSdf); 这保证了即便进行了强烈的非均匀拉伸/压缩，步进仍然稳定。 5.3 操作建议想要放大/缩小整体：三个滑条同步增减即可；想要某一方向拉伸，单独调整该轴对应的数值。数值边界：保持每个半轴不小于 ~0.05，可避免极端情况下的数值不稳定；Shader 已额外使用 1e-5 防卫。坐标系约定：文中 Length->X，Height->Y，Width->Z。保持 UI 与期望轴向一致，避免视觉/交互混淆。六、距离缩放在采样得到SDF Mesh中距离值后，还需要进行缩放处理，即： dTex * scaleMin ：归一化存储的本质: SDF纹理资产在制作时，其内部的距离值被归一化到了一个标准范围（如 $[0,1]$）。这使得资产本身与具体尺寸解耦，便于管理和复用。匹配场景尺度: 我们的渲染场景工作在具体的“世界单位”下。光线步进的步长、碰撞检测的阈值，都依赖于SDF函数返回的真实距离。scaleMin 将纹理中无单位的相对距离，转换为场景中有意义的绝对距离。七、结语通过将复杂的几何体预计算为SDF 3D纹理，我们成功地打破了传统解析式SDF的局限，为光线步进的世界打开了渲染任意模型的大门。从坐标变换、边界定义，到核心的纹理坐标映射与采样，每一步都体现了计算机图形学中空间与数据巧妙结合的智慧。更重要的是，通过对算法的深入分析，我们发现了利用包围盒进行提前剔除的优化空间，并在实践中权衡了GPU分支带来的利弊。这提醒我们，在追求更高真实感的同时，对性能的极致探索同样是图形程序员永恒的课题。希望本文能为你在这条探索之路上提供一些有价值的参考。

3D SDF · 2025-09-18

4.基于物理的渲染

效果对比经验模型： PBR模型：渲染方程与BRDF 理论上，PBR致力于求解渲染方程的简化形式。对于单个方向光，我们可以将其简化为： \[L_o(v) = (\text{BRDF}) \cdot L_i \cdot \max(0, n \cdot l)\] 其中： $L_o(v)$ 是出射到观察者（视角向量 $v$）的光的辐射率（最终颜色）。 $L_i$ 是入射光的辐射率（光源颜色和强度）。 $n$ 是表面法线。 $l$ 是光照方向向量。 $\max(0, n \cdot l)$ 是朗伯余弦项，表示光线入射角度对表面亮度的影响。在代码的 getLight 函数中，这一步对应： // === PBR LIGHTING === vec3 brdf = cook_torrance_brdf(pbrAlbedo, n, viewDir, l, roughness, metallic); float pbrIntensity = 3.0; // 艺术调整的强度 // BRDF * Li * (n·l) is inside brdf finalColor += brdf * lightColor * shadow * u.lightDir.w * pbrIntensity; 注意：代码中的 (n·l) (NdotL) 项被移到了 cook_torrance_brdf 函数的末尾进行计算，这是出于组合上的方便。 BRDF的构成：漫反射 + 镜面反射 Cook-Torrance BRDF将反射分为两个部分：漫反射（Diffuse）和镜面反射（Specular）。 \[f_r = k_d f_{\text{lambert}} + k_s f_{\text{cook-torrance}}\] $f_{\text{lambert}}$ 是漫反射项。 $f_{\text{cook-torrance}}$ 是镜面反射项。 $k_d$ 和 $k_s$ 是能量守恒系数，代表漫反射和镜面反射的能量比例。 1. 漫反射分量 (Diffuse Component) 程序使用了标准的 Lambertian 模型（兰伯特）。公式: $f_{\text{lambert}} = \frac{c}{\pi}$ 其中 $c$ 是表面的反照率（Albedo），即基础颜色。除以 $\pi$ 是为了对所有出射方向的半球进行归一化，确保表面反射的总能量不超过入射能量。代码实现: 在 cook_torrance_brdf 函数中： // albedo 就是公式中的 c // kD 是能量守恒系数，我们稍后讨论 vec3 diffuse = kD * albedo / PI; 2. 镜面反射分量 (Specular Component) 这是PBR的核心，由Cook-Torrance微表面模型定义。公式: $f_{\text{cook-torrance}} = \frac{D \cdot G \cdot F}{4(n \cdot v)(n \cdot l)}$ 它由三个核心函数（D, G, F）和一个归一化分母组成。代码实现: vec3 numerator = NDF * G * F; // 分子 D*G*F // 分母 4(n·v)(n·l)，并加一个极小值避免除以零 float denominator = 4.0 * max(dot(N, V), 0.0) * max(dot(N, L), 0.0) + 0.0001; vec3 specular = numerator / denominator; 现在我们来逐一解析 D, G, F。 2.1 法线分布函数 (D) - distribution_ggx 该函数描述了微表面法线的统计学分布，即有多少微表面的朝向恰好能将光线反射到观察者眼中。模型: GGX (Trowbridge-Reitz) 公式: $D(h) = \frac{\alpha^2}{\pi(((n \cdot h)^2(\alpha^2 - 1) + 1)^2)}$ $h$ 是半程向量（normalize(v + l)），代表了能够完美反射光线到视角的微表面法线方向。 $\alpha$ 是表面粗糙度（roughness）的平方，即 $\alpha = \text{roughness}^2$。代码实现: distribution_ggx 函数完美地复现了这个公式。 float distribution_ggx(vec3 N, vec3 H, float roughness) { float a = roughness * roughness; // α float a2 = a * a; // α² float NdotH = max(dot(N, H), 0.0); // (n·h) float NdotH2 = NdotH * NdotH; // (n·h)² float num = a2; // 分子: α² // 分母中的括号项: ((n·h)²(α² - 1) + 1) float denom = (NdotH2 * (a2 - 1.0) + 1.0); denom = PI * denom * denom; // 最终分母: π * (...)^2 return num / max(denom, 0.0001); // D = num / denom } 2.2 几何函数 (G) - geometry_smith 该函数模拟微表面之间的自遮蔽和自阴影，确保光照计算的物理准确性。法线分布函数去估计了反射到观察者视角的光线强度，比较容易理解，而几何函数则相对抽象。具体来说，存在两种遮挡情况：遮蔽 (Masking)：从某个微表面反射出来的光，在到达你的眼睛（相机）之前，被另一个微表面挡住了。阴影 (Shadowing)：入射的光线，在到达某个微表面之前，被另一个微表面挡住了，导致那个微表面本身就处于阴影中。模型: Smith’s Method，并为视线（view）和光线（light）方向分别计算，然后相乘。每个方向的计算都使用了高效的 Schlick-GGX 近似。==这种方法将“遮蔽 (Masking)”和“阴影 (Shadowing)”分开计算，然后将它们的“可见”比例相乘，得到最终的总“可见”比例。== G_view：从观察方向（向量 v）看，有多少微表面是可见的（没有被 Masking）。 G_light：从光照方向（向量 l）看，有多少微表面是被照亮的（没有被 Shadowing）。公式: $G(n, v, l) = G_{\text{schlick}}(n, v, k) \cdot G_{\text{schlick}}(n, l, k)$ 其中， $G_{\text{schlick}}(n, \text{vec}, k) = \frac{n \cdot \text{vec}}{(n \cdot \text{vec})(1 - k) + k}$ 而 $k$ 是粗糙度的重映射：$k = \frac{(\text{roughness} + 1)^2}{8}$。代码实现: geometry_smith 和 geometry_schlick_ggx 两个函数协同工作。 // G_schlick 实现 float geometry_schlick_ggx(float NdotV, float roughness) { float r = (roughness + 1.0); float k = (r * r) / 8.0; // k float num = NdotV; // 分子: (n·v) float denom = NdotV * (1.0 - k) + k; // 分母 return num / max(denom, 0.0001); } // Smith's Method 实现 float geometry_smith(vec3 N, vec3 V, vec3 L, float roughness) { float NdotV = max(dot(N, V), 0.0); float NdotL = max(dot(N, L), 0.0); float ggx2 = geometry_schlick_ggx(NdotV, roughness); // G_schlick(n, v) float ggx1 = geometry_schlick_ggx(NdotL, roughness); // G_schlick(n, l) return ggx1 * ggx2; // G = G1 * G2 } 那么，为什么这种计算方式能够模拟遮挡？关键参数 k： k 是由 roughness 计算得出的。当 roughness = 0 (光滑)，k = (1*1)/8 = 0.125。当 roughness = 1 (粗糙)，k = (2*2)/8 = 0.5。所以，k 可以被理解为“粗糙度因子”。k 越大，表面越粗糙。关键变量 NdotV： NdotV (即 $n \cdot v$) 是宏观表面法线 N 和视线 V 的点积。它代表了观察角度的陡峭程度。当 NdotV ≈ 1：我们几乎是垂直于表面向下看。当 NdotV ≈ 0：我们正在以一个非常刁钻的、几乎平行于表面的角度（掠射角）观察。现在我们把 k 和 NdotV 结合起来看，分析两种极端情况：情况一：垂直观察 (NdotV ≈ 1) 无论表面有多粗糙（k 值是多少），将 NdotV = 1 代入分母： denom = 1 * (1 - k) + k = 1 - k + k = 1 此时，G = num / denom = 1 / 1 = 1。物理意义：当从正上方看一个粗糙表面时，基本上能看到所有的“峡谷”底部，几乎没有遮蔽发生。所以几何衰减为1（即没有衰减），这是完全正确的。情况二：掠射角观察 (NdotV ≈ 0) 将 NdotV = 0 代入分母： denom = 0 * (1 - k) + k = k 此时，G = num / denom = NdotV / k。因为 NdotV 趋近于0，所以 G 也趋近于0。物理意义：当以近乎平行的角度去看一个表面时，前景的“山峰”会完全挡住后面的“峡谷”，会看到大量的遮蔽。因此，可见的微表面比例急剧下降，趋近于0。关键洞察这个公式实际上是一个巧妙的插值。它在 NdotV = 1 (结果为1) 和 NdotV = 0 (结果为0) 之间进行平滑过渡。粗糙度因子 k 控制了这个过渡的剧烈程度。对于光滑表面 (k很小)，分母 NdotV * (1 - k) + k 的值会非常接近 NdotV 本身。所以 G 的值在大部分角度下都接近1，只有在角度极其刁钻时才会快速下降。这模拟了光滑表面不易发生遮蔽的特性。对于粗糙表面 (k很大)，分母会更快地偏离 NdotV，使得 G 的值随着 NdotV 变小而下降得更快、更早。这完美地模拟了粗糙表面在掠射角下，遮蔽现象非常严重的特性。 2.3 菲涅尔方程 (F) - fresnel_schlick 该函数描述了在不同观察角度下，表面反射光线所占的比例。模型: Schlick 近似法公式: $F(h, v) = F_0 + (1 - F_0)(1 - \max(0, h \cdot v))^5$ $F_0$ 是光线垂直入射（0度角）时的基础反射率。这是区分金属和非金属（电介质）的关键。代码实现: // Schlick 近似公式 vec3 fresnel_schlick(float cosTheta, vec3 F0) { // cosTheta 是 (h·v) return F0 + (1.0 - F0) * pow(clamp(1.0 - cosTheta, 0.0, 1.0), 5.0); } F0 的计算在 cook_torrance_brdf 函数中： vec3 F0 = vec3(0.04); // 非金属的 F0 普遍近似为 0.04 // 使用 metallic 值在非金属 F0 和金属 F0 (即其albedo颜色) 之间插值 F0 = mix(F0, albedo, metallic); // ... 调用 fresnel_schlick vec3 F = fresnel_schlick(max(dot(H, V), 0.0), F0); 3. 能量守恒 (Energy Conservation) 确保出射光线的总能量不超过入射光线，这是物理渲染的基础。程序通过 kD 和 kS 系数来控制能量在漫反射和镜面反射之间的分配。原理: 菲涅尔方程 F 的结果 (kS) 直接告诉我们光线中有多少比例被镜面反射了。那么剩下的 1.0 - kS 就是被折射进物体内部、可用于漫反射的能量比例 (kD)。代码实现: vec3 kS = F; // 镜面反射比例由菲涅尔项决定 vec3 kD = vec3(1.0) - kS; // 剩下的能量用于漫反射 // 金属没有漫反射，所以当 metallic=1.0 时，kD 应为0 kD *= 1.0 - metallic; 这段代码实现了能量守恒，并正确处理了金属材质（其 metallic 值为1.0，导致 kD 变为0，从而没有漫反射）。

3D SDF · 2025-09-07

3.优化VPLs采样

动机一个典型的RSM可能包含成千上万甚至数百万个VPLs。对着色点 p，计算每一个VPL的贡献是极其耗费性能的。一个朴素的优化是只在着色点 p 周围的一个固定半径内采样VPLs。但是，即便如此，也不是所有邻近的VPL都同样重要。有些VPL可能因为角度、遮挡或者自身亮度很低，对着色点 p 的贡献微乎其微。如果我们用均匀采样（Uniform Sampling），在采样区域内随机或均匀地选取VPLs，就会浪费大量的计算在这些贡献很小的VPL上，导致结果充满噪点（noise），或者需要极大量的样本才能获得平滑的效果。重要性采样 (Importance Sampling) 重要性采样的核心思想是：与其均匀地采样，不如“智能”地将更多的采样机会分配给那些贡献最大的VPLs。这样，我们就可以用更少的样本数量，获得更高质量、更低噪点的结果。一个VPL对点 p 的光照贡献有多“重要”呢？这通常取决于以下几个因素，这构成了我们的重要性度量（Importance Metric）： VPL的辐射通量（Flux）：VPL本身越亮，它的贡献就越大。几何项（G-Term）：着色点 p 的法线 n 与 VPL -> p 方向的夹角 ($cos\theta_p$)。 VPL的法线 $n_{vpl}$ 与 p -> VPL 方向的夹角 ($cos\theta_{vpl}$)。 p 与VPL之间的距离衰减 ($1/d^2$)。 BRDF：着色点 p 的表面材质属性。综合起来，一个VPL的贡献可以近似地用下面的渲染方程的简化形式来描述： \[L_o(p, \omega_o) = \int_{\Omega} f_r(p, \omega_i, \omega_o) \cdot L_i(p, \omega_i) \cdot \cos(\theta_i) \, d\omega_i\] 在使用VPLs时，这个积分变成了对所有VPLs的求和： \[L_{indirect}(p) \approx \sum_{k=1}^{N} \frac{\Phi_k}{\pi} \cdot BRDF(p) \cdot \frac{\max(0, n \cdot \omega_k) \cdot \max(0, n_k \cdot -\omega_k)}{||p_k - p||^2} \cdot V(p, p_k)\] 其中： $\Phi_k$ 是第k个VPL的通量（flux）。 $BRDF(p)$ 是点p的BRDF（代码中是 albedo / PI）。 $p_k, n_k$ 是第k个VPL的位置和法线。 $\omega_k$ 是从p指向 $p_k$ 的归一化向量。 $V(p, p_k)$ 是可见性函数（在代码中通过剔除背面和距离过近的点来简化）。重要性采样的目标就是找到一个概率密度函数（PDF），使得采样分布与这个贡献函数尽可能相似。这里类似于光线追中中蒙题卡洛采样的思想，使用PDF确定光线。均匀采样 vs. 重要性采样均匀采样这是传统的、非重要性采样的方法。 // === UNIFORM SAMPLING - Original Strategy === vec2 offs[32] = vec2[32](...); // 预定义的32个均匀分布的采样偏移 int N = min(samples, 32); ... for (int i = 0; i < N; ++i) { // 对偏移加上一点随机扰动，减少条带状瑕疵 vec2 jitter = ...; vec2 duv = (offs[i] + jitter * 0.05) * radius / ...; vec2 uv = clamp(baseUV + duv, 0.0, 1.0); // 从RSM纹理中获取VPL信息 vec3 vplPos = texture(rsmPositionTex, uv).xyz; vec3 vplNor = normalize(texture(rsmNormalTex, uv).xyz); vec3 flux = texture(rsmFluxTex, uv).xyz; // ... (检查VPL有效性) ... // 计算光照贡献 vec3 wi = vplPos - p; float dist = length(wi); wi = normalize(wi); float cos1 = max(dot(n, wi), 0.0); float cos2 = max(dot(vplNor, -wi), 0.0); float distWeight = 1.0 / (1.0 + dist * dist); float sampleWeight = cos1 * cos2 * distWeight; // 权重 vec3 brdf = albedo / 3.14159; bounce += brdf * flux * sampleWeight; totalWeight += sampleWeight; } 解释: 它使用一个固定的采样模式 offs 在着色点周围的RSM区域内进行采样。每个样本被选中的概率是相同的。它计算每个VPL的贡献 (brdf * flux * sampleWeight)，然后累加起来。这种方法简单直接，但效率低下。如果采样区域内大部分VPL的 flux 很小或者 sampleWeight 接近于0，那么很多采样都是无效的。三阶段自适应重要性采样阶段 1: 粗略分析 (Coarse Analysis Pass) 这个阶段的目标是快速找到哪个方向的VPLs最重要。 // Phase 1: Coarse Analysis Pass (8 samples) vec2 coarseOffs[8] = vec2[8](...); // 8个方向上的粗略采样点 float maxImportance = 0.0; vec2 bestRegion = vec2(0.0); for (int i = 0; i < 8; ++i) { vec2 duv = coarseOffs[i] * radius * 0.5 / ...; vec2 uv = clamp(baseUV + duv, 0.0, 1.0); // 获取VPL信息 vec3 vplPos = texture(rsmPositionTex, uv).xyz; vec3 vplNor = texture(rsmNormalTex, uv).xyz; vec3 flux = texture(rsmFluxTex, uv).xyz; if (length(vplPos) < 0.1) continue; // 计算重要性度量 vec3 wi = normalize(vplPos - p); float cos1 = max(dot(n, wi), 0.0); float cos2 = max(dot(vplNor, -wi), 0.0); float fluxMag = length(flux); float importance = cos1 * cos2 * fluxMag; // 核心：重要性函数 if (importance > maxImportance) { maxImportance = importance; bestRegion = duv; // 记录下最重要的区域的偏移方向 } } 解释: 它只用了8个样本，在周围8个方向上进行探测。它计算了一个重要性度量（Importance Metric）： $\text{Importance} = \max(0, n \cdot \omega_i) \cdot \max(0, n_{vpl} \cdot -\omega_i) \cdot ||\text{Flux}||$ 这个公式忽略了距离衰减（因为这是一个方向性探测）和BRDF（假设为常数），但抓住了影响贡献度的核心要素：几何关系和VPL亮度。循环结束后，bestRegion 变量存储了最有潜力的采样方向。阶段 2: 集中密集采样 (Focused Dense Sampling) 在找到“黄金区域”后，这个阶段将大部分样本（20个）集中投放到该区域内部及其周围。 // Phase 2: Focused Dense Sampling (20 samples) vec2 denseOffs[20] = vec2[20](...); // 20个在小范围内的密集偏移 ... for (int i = 0; i < 20; ++i) { vec2 localOffset = denseOffs[i] * 0.3; // 关键：所有采样都围绕着 bestRegion 进行 vec2 duv = (bestRegion + localOffset * radius / ...); vec2 uv = clamp(baseUV + duv, 0.0, 1.0); // ... 和均匀采样类似，获取VPL信息并计算贡献 ... bounce += brdf * flux * sampleWeight; totalWeight += sampleWeight; } 解释: 所有的采样偏移 duv 都是基于第一阶段找到的 bestRegion 计算的。这确保了大部分计算资源都用在了刀刃上。这种策略极大地提高了采样的效率，因为我们更有可能采样到贡献大的VPLs。阶段 3: 覆盖采样 (Coverage Sampling) 只在最亮的区域采样可能会导致问题：如果场景中有多个次要的光源贡献区域，完全忽略它们会造成能量损失和颜色偏移。这个阶段用少量样本（4个）来覆盖更广泛的区域，以拾取那些被前两个阶段可能忽略掉的贡献。 // Phase 3: Coverage Sampling (4 samples) vec2 coverageOffs[4] = vec2[4](...); // 4个随机分布在较大范围的偏移 ... for (int i = 0; i < 4; ++i) { vec2 duv = coverageOffs[i] * radius / ...; // ... 计算并累加贡献 ... } 解释: 这4个样本被放置在采样半径内比较分散的位置，扮演着“查漏补补缺”的角色。它确保了即使我们的“最佳区域”判断有误，或者存在多个重要区域时，渲染结果也不会出现大的瑕疵。效果对比不启用重要性采样：启用重要性采样：其实除了墙角处效果有明显区别，其他多数区域效果并没有明显提升，可能是由于当前的采样点数量（32）已经足够大，即使均匀采样也能取得不错的效果速度对比然而，启用重要性采样后，帧时间从12ms降低到9ms。在代码中，均匀采样和重要性采样都采样32个点，在采样点数量一致的情况下，执行速度的提升主要是由于==重要性采样的工作模式对GPU的并行处理流水线极为友好，而均匀采样的“盲目性”则会频繁地打断流水线，造成效率下降。== 线程发散 (Thread Divergence) GPU并非一个一个地处理像素，而是将屏幕上成百上千的像素（着色器实例）打包成一个个线程组（在NVIDIA上称为Warp，通常是32个线程；在AMD上称为Wavefront）。在同一个线程组内，所有线程在同一时刻执行完全相同的指令。现在我们来看循环内部的关键判断语句： // 这三行是性能的关键 if (length(vplPos) < 0.1) continue; // VPL无效，跳过 if (dist < 0.05) continue; // VPL离自己太近，跳过 if (cos1 < 0.05 || cos2 < 0.05) continue; // VPL朝向不对，跳过当一个线程组（比如32个相邻的像素）遇到if语句时，会发生什么？理想情况 (高连贯性): 如果线程组里所有32个线程的判断结果都一样（比如都为true或都为false），那么GPU就可以无缝地、集体地执行if块内的代码或者集体跳过。这是最高效的。糟糕情况 (线程发散): 如果线程组里部分线程结果为true，另一部分为false，就发生了“线程发散”。这时，GPU不得不同时处理两个分支。它会先执行if为true的路径，此时false的线程被临时“关闭”等待；然后再执行if为false的路径，此时true的线程被“关闭”等待。最终，整个线程组的耗时是两条路径耗时之和，效率大打折扣。现在我们把这个原理应用到两种采样方法上：均匀采样 (12ms，慢) 它的采样点是分散的、随机的。对于一个线程组（32个相邻像素），它们各自随机采样的32个VPL，情况会非常混乱：像素A的第5个样本可能是无效的 (continue)。邻居像素B的第5个样本可能是有效的 (执行完整计算)。邻居像素C的第5个样本可能因为朝向不对而continue。这就导致在循环的几乎每一次迭代中，线程组内部都存在大量的线程发散。GPU的流水线被频繁地打断和等待，即使很多线程因为continue跳过了大量计算，但整个线程组仍然要为那些没有跳过的“幸运”线程付出等待的时间成本。重要性采样 (9ms，快) 它的采样点是高度结构化和局部化的。由于相邻像素的位置和法线通常很相似，它们在第一阶段找到的bestRegion（最佳区域）也极有可能是同一个或非常邻近的区域。因此，当一个线程组（32个相邻像素）进入第二阶段的密集采样时，它们采样的VPL都来自RSM纹理上的一小块相似区域。结果就是：如果这个区域的VPL是有效的，那么线程组里几乎所有线程采到的VPL也都是有效的，大家一起执行完整的计算。如果这个区域的VPL是无效的，那么线程组里几乎所有线程都会触发continue，大家一起跳过。这种高度的执行连贯性最大化了GPU的并行效率。虽然它可能执行了更多次完整的循环体（因为采到的都是有效样本），但由于没有线程发散造成的流水线停顿，整体的“吞吐量”反而更高，执行速度更快。缓存效率 (Cache Locality) 采样点的分布也会影响缓存的效率，这一思想在我们之前的一个优化模糊算法的项目中也有体现。均匀采样的样本在RSM纹理上是随机分散的，这会导致纹理缓存（Texture Cache）命中率低。GPU需要频繁地从速度较慢的显存中去读取数据。重要性采样的样本高度集中在bestRegion周围，这使得纹理缓存命中率极高。一旦第一个线程读取了某一块纹理数据，它就会被加载到高速缓存中，后续线程（无论是同一个像素的后续样本，还是邻居像素的样本）都能极快地从缓存中获取数据，进一步提升了性能。

3D SDF · 2025-08-25

2.RSM阴影和一次间接光照

3D SDF · 2025-08-25

1.预备知识和基于3D SDF的康奈尔盒子

基础知识留个坑。效果抱歉，您的浏览器不支持内嵌视频。算法步骤阶段一：准备与射线生成 (Preparation & Ray Generation) 设置摄像机 (Camera Setup)：在3D世界中定义摄像机的位置 (ro)、观察目标 (ta) 和姿态。基于这些信息，构建一个从“相机空间”到“世界空间”的变换矩阵，用于正确地投射射线。生成主射线 (Primary Ray Generation)：遍历屏幕上的每一个像素。将每个像素的2D屏幕坐标（如 (800, 600)）转换为归一化的3D观察坐标（这是实现透视投影的关键）。最终，为每个像素生成一条独一无二的、从摄像机位置 ro 出发，射入3D场景的射线方向 rd。阶段二：场景求交 (Scene Intersection via Ray Marching) 光线步进循环 (Ray Marching Loop)：让射线从起点开始，在场景中步进。此过程通常使用一种名为球面追踪 (Sphere Tracing)（也被称为光线步进 (Ray Marching)）的高效算法。在每一步，调用全局的场景SDF函数 map()，计算射线当前末端位置到场景中所有物体的最短距离 d。这个距离 d 保证了我们可以沿着射线方向安全前进 d 的距离，而不会穿过任何物体表面。循环往复地让射线前进 d 的距离，直到 d 的值小于一个极小的阈值（例如 0.0001），这标志着射线已经命中了某个物体的表面。记录交点信息 (Intersection Data)：一旦命中，记录下关键信息：交点坐标 pos: ro + total_distance * rd。物体材质ID m: 用于区分不同物体（例如，地面、球体、盒子等）。阶段三：表面着色 (Surface Shading) 获取表面基础属性 (Acquire Surface Properties)：计算法线 nor: 通过在交点 pos 附近极小范围内多次采样SDF，估算出表面的梯度，从而得到该点的法线向量。这是所有光照计算的基础。计算反射向量 ref: 根据视线方向 rd 和法线 nor，计算出完美的镜面反射方向，用于模拟环境反射。确定基础材质与颜色 (Determine Base Material & Color)：根据之前记录的材质ID m，为交点赋予基础颜色（Albedo）。这是一个分支判断点：如果是地面 (m < 1.5)，则通过 checkersGradBox 函数计算程序化的棋盘格纹理；如果是其他物体，则根据ID赋予不同的纯色。计算环境光遮蔽 (Ambient Occlusion)：在法线方向上进行数次短距离步进，检查周围的几何体密度，计算AO系数值。这个值会使角落和缝隙等难以被环境光照亮的区域变暗，极大地增强立体感。累加多光源光照 (Accumulate Lighting from Multiple Sources)：主光源 (Key Light): 模拟太阳等强光源。其贡献主要包括漫反射（Diffuse）和高光（Specular）两部分。高光部分使用Blinn-Phong模型计算，并且整个光照贡献会乘以 calcSoftshadow 函数返回的软阴影系数。天空光 (Sky Light): 模拟来自天空的环境光。通过检查反射向量 ref 的方向来确定光照强度，并再次调用 calcSoftshadow 函数沿着 ref 方向进行检测，实现反射遮挡，防止物体“穿透”其他物体反射天空。补光 (Fill Light): 一个强度较弱的辅助光源，用于提亮场景的暗部，使其不至于死黑。边缘光 (Rim Light): 根据视线和法线的夹角（菲涅尔效应的近似）在物体边缘添加一道高光，用于将物体轮廓与背景分离开。阶段四：后期处理与输出 (Post-Processing & Final Output) 添加雾效 (Fog)：根据交点与摄像机的距离 t，将计算出的最终光照颜色与一个全局的“雾色”进行混合。距离越远，物体颜色越接近雾色，营造出深远的大气感。最终颜色校正与输出 (Final Correction & Output)：对计算出的颜色进行伽马校正 (Gamma Correction)，使其在显示器上看起来更自然。将最终的颜色值输出到当前像素。箱子场景算法 +-----------------------------+ | main() 函数开始 | +-------------+---------------+ | +---------------------v---------------------+ | 1. 设置相机，并将像素位置转换为光线方向 | +---------------------+---------------------+ | +-------------v-------------+ | 2. rayMarch() | | 光线步进，寻找与物体的 | | 交点距离 d | +-------------+-------------+ | +---------------v---------------+ | 光线是否击中物体 (d < MAX_DIST)? | +---------------+---------------+ | +---------------------+---------------------+ | 是 | 否 (未击中) +-----------v-----------+ +-----------v-----------+ | 3. 计算交点 p 和法线 n | | 使用默认背景色 | +-----------+-----------+ +-----------+-----------+ | | +-----------v-----------+ | | 4. 获取材质和基础色 | | | (albedo) | | +-----------+-----------+ | | | +-----------v-----------+ | | 5. getLight() | | | 计算光照、阴影、高光| | +-----------+-----------+ | | | +-----------v-----------+ +-----------v-----------+ | 6. 添加雾效和后期调色 | <-------------------+ +-----------+-----------+ | +-----------v-----------+ | 7. 输出最终像素颜色 | +-----------------------+ 初始化：设置坐标与相机屏幕坐标转换：在 main 函数中，首先将输入的二维纹理坐标（范围 [0, 1]）转换为以屏幕中心为原点的标准化坐标（范围 [-1, 1]），并根据屏幕的宽高比进行校正，防止图像拉伸。定义虚拟相机：设置一个虚拟相机的位置（ro，光线起点）和它看向的目标点。计算光线方向：根据相机的位置和当前像素在屏幕上的位置，计算出一条从相机出发、穿过该像素的光线方向向量（rd）。光线步进：寻找与场景的交点调用核心的 rayMarch 函数，沿着上一步计算出的光线方向（rd）从相机位置（ro）开始前进。核心思想：在每一步，通过调用 sceneSDF 函数计算当前位置到场景中所有物体表面的最短距离 dS。这个距离就是本次可以安全前进的最大步长。循环前进：不断地沿着光线方向前进 dS 的距离，直到光线与某个物体的表面足够近（小于阈值 SURF_DIST）或者超出了最大渲染距离（MAX_DIST）。函数最终返回光线从相机出发到击中物体的总距离 d。表面着色：计算交点颜色如果光线成功击中物体（d < MAX_DIST），则开始计算该点的颜色。计算交点信息：根据行进距离 d 计算出光线与场景的精确三维交点坐标 p，并调用 getNormal 函数计算该点的表面法线向量 n。判断材质：调用 getMaterial 函数判断交点 p 属于哪个物体（球体还是墙壁）。获取基础色（Albedo）：如果击中的是球体，则调用 getGradientColor 计算出复杂的、带有动画效果的渐变色。如果击中的是墙壁，则赋予一个简单的、带有微小变化的蓝色。进行光照计算：调用 getLight 函数，这是最关键的着色步骤。它综合了多种光照效果：环境光：提供一个基础的整体亮度。主光源：计算来自主方向光的漫反射（物体颜色）和高光（镜面反射）。高光计算时使用Phone模型，计算反射方向。这是一个单pass的流程（没有使用shadowMap）==，阴影的计算依赖于反射方向。== 软阴影：在计算主光源时，会从交点 p 向光源方向再次进行一次简化的光线步进（softShadow 函数），以判断该点是否处于阴影中，并计算出阴影的柔和程度。辅助光：添加填充光（照亮暗部）和边缘光（勾勒轮廓），使光照效果更丰富。添加雾效：根据交点与相机的距离 d，将颜色与背景色进行混合，模拟出远景模糊的雾化效果，增加场景的深度感。后期处理与输出在得到基础光照颜色后，进行最后的画面调整。 Gamma校正：调整颜色亮度，使其在显示器上看起来更自然。色彩调整：为整个画面叠加一层微妙的蓝色调，以统一风格。最终输出：将计算完成的最终颜色赋值给 outColor，作为当前像素的显示颜色。菲涅尔效应对于大多数电介质（非金属，如水、玻璃、塑料等），观察角度越接近于平行于表面（即掠射角），表面的反射能力就越强。这是让材质看起来更真实、更有质感的关键因素之一。 // 菲涅尔效应：视角与法线夹角越大，反射越强（常见于水面、玻璃等） float fresnel = 1.0; if (matId == 1) { // 只对球体应用 fresnel = pow(1.0 - max(0.0, dot(viewDir, n)), 2.0); } 这段代码通过计算视角和法线夹角的余弦，实现了一个简单的函数：夹角越大（越接近掠射角），fresnel 的值就越接近1.0（反射越强）。 pow(1.0 - dot(V, N), power) 的形式是一种广为人知的、计算成本极低的“边缘光”或“伪菲涅尔”效果的实现方式。 PBR 从“基于物理的渲染 (PBR)”的角度来讲，上述方式不是标准的，但接近。在现代PBR工作流中，行业标准是使用 ==Schlick 近似法 (Schlick’s Approximation) ==来模拟菲涅尔效应，其公式为： \[F(\theta) = F_0 + (1-F_0)(1-\cos\theta)^5\] 基础反射率 ($F_0$): Schlick 模型包含一个 $F_0$ 项，代表垂直入射时的基础反射率（比如水在垂直看时约有2%的反射率）。而代码中的公式相当于假设 $F_0$=0，即垂直看时完全没有反射，这在物理上是不准确的。幂次 (Power): Schlick 模型标准使用 5 次幂，这个数字能更好地拟合真实世界物质的反射曲线。代码中使用了 2 次幂，这会使菲涅尔效应的过渡区域更宽、更柔和，是一种艺术上的选择，而非物理上的拟合。主光源主光源，或称为关键光，是场景中最主要、最强的光源，它决定了物体大部分的明暗关系和阴影的朝向。在这段代码中，主光源的计算包含了三个主要部分：漫反射（Diffuse Reflection）、高光反射（Specular Reflection）和软阴影（Soft Shadow）。 // --- 准备工作 --- vec3 l = normalize(-u.lightDir.xyz); // 主光源方向 vec3 r = reflect(-l, n); // 反射光方向 // ... // 1. 主光源 (Key Light) if (u.enableLights.x == 1) { // --- 漫反射计算 --- float ndotl = max(0.0, dot(n, l)); float diff = ndotl; // --- 高光计算 (模拟GGX) --- float rough = clamp(1.0 - u.shadowParams.w, 0.05, 0.95); float specPower = mix(16.0, 64.0, u.shadowParams.w); float spec = pow(max(0.0, dot(viewDir, r)), specPower) * (1.0 - rough); // --- 阴影计算 --- float shadow = softShadow(p + n * 0.07, l, 0.07, 6.0, 6.0 * u.shadowParams.x); shadow = mix(0.3, 1.0, shadow * u.shadowParams.y); // --- 最终组合 --- vec3 lightColor = u.lightColors[0].rgb * u.lightColors[0].a; finalColor += (diff * albedo + spec * lightColor) * lightColor * shadow * u.lightDir.w; } 第一步：向量定义 vec3 n: 法线向量 (Normal)，垂直于物体表面。 vec3 viewDir: 视角向量 (View Direction)。 vec3 l = normalize(-u.lightDir.xyz);: 光源向量 (Light Direction)。u.lightDir 定义的是光照射来的方向（例如从上到下），我们需要的是从表面指向光源的向量，所以要对其进行取反 - 并单位化 normalize。 vec3 r = reflect(-l, n);: 反射向量 (Reflection Vector)。计算的是光源向量 l 相对于法线 n 的完美镜面反射方向（用于计算Phone模型高光和软阴影）。第二步：漫反射 (Diffuse) 计算漫反射模拟的是光线被粗糙表面向各个方向均匀散射的效果。它决定了物体不受高光影响的基础明暗。漫反射不考虑出射方向，==强度由入射方向和法向决定==。 float ndotl = max(0.0, dot(n, l)); float diff = ndotl; dot(n, l): 计算法线向量 n 和光源向量 l 的点积。当光线垂直照射到表面时 (n 和 l 方向相同)，点积为 1，表面最亮。当光线平行于表面照射时 (n 和 l 互相垂直)，点积为 0，表面不受光。当光线从表面背面照射时，点积为负数。 max(0.0, ...): 使用 max 函数确保点积结果不会是负数，因为背面的光线不应该对正面产生照明效果。 float diff = ndotl;: 将这个 ndotl 的结果作为漫反射强度 diff。这种光照模型被称为 Lambertian 反射，是最简单和常见的漫反射模型。最终，漫反射对颜色的贡献是 diff * albedo，即漫反射强度乘以物体基础色。第三步：高光 (Specular) 计算高光模拟的是光滑表面（如金属、塑料）对光源的镜面反射。 ==高光强度由和出射方向决定（或Blinn-Phone中使用半程向量和法向）。== float rough = clamp(1.0 - u.shadowParams.w, 0.05, 0.95); float specPower = mix(16.0, 64.0, u.shadowParams.w); float spec = pow(max(0.0, dot(viewDir, r)), specPower) * (1.0 - rough); 这段代码实现了一个简化的 Blinn-Phong 高光模型，并加入了一些模拟PBR（基于物理的渲染）中金属度/粗糙度的概念。 dot(viewDir, r): 计算视角向量 viewDir 和反射向量 r 的点积。如果视线方向 viewDir 与完美反射方向 r 完全重合，点积为 1，此时看到的高光最强。视线与反射方向偏离得越远，点积越小，高光越弱。 max(0.0, ...): 同样是防止结果为负。 pow(..., specPower): 这是高光计算的核心。将点积结果进行 specPower (高光指数) 次幂。 specPower 的值越大，高光点越小、越锐利，模拟的表面也越光滑。 specPower 的值越小，高光点越大、越模糊，模拟的表面也越粗糙。 u.shadowParams.w: 这个uniform变量在这里被巧妙地用作金属度 (metalness) 或光滑度 (smoothness) 的控制器。当它为 0 时, specPower 为 16 (高光模糊)，当它为 1 时, specPower 为 64 (高光锐利)。mix 函数在其间进行线性插值。 * (1.0 - rough): 用一个 rough (粗糙度) 变量来进一步控制高光强度，这借鉴了PBR的思想。rough 越高，高光越弱。最终，高光的颜色贡献是 spec * lightColor，即高光强度乘以光源颜色。第四步：软阴影 (Soft Shadow) 计算为了判断表面上的点 p 是否处于阴影中，代码从点 p 出发，沿着光源方向 l 进行了一次光线步进（Ray Marching）。 float shadow = softShadow(p + n * 0.07, l, 0.07, 6.0, 6.0 * u.shadowParams.x); shadow = mix(0.3, 1.0, shadow * u.shadowParams.y); softShadow(...): 这个函数返回一个 [0.0, 1.0] 之间的值。1.0 表示完全没有遮挡（在光下），0.0 表示完全被遮挡（在阴影中）。其内部通过多次步进检查光路上是否有物体，并根据遮挡物与当前点的距离来计算出柔和的阴影过渡，而不是硬邦邦的边缘。 p + n * 0.07: 将阴影光线的起始点沿着法线方向稍微移开一点，这是一种常见的避免“自遮挡”问题的技术。 mix(0.3, 1.0, ...): 对 softShadow 返回的原始阴影值进行调整。 shadow * u.shadowParams.y: 使用 u.shadowParams.y 来控制阴影的整体强度。 mix(...): 重新映射阴影的范围。即使在最暗的阴影处（shadow 值为0），最终的 shadow 值也是 0.3，而不是全黑的 0.0。这==模拟了现实世界中来自环境的反光==，使得阴影区域不是死黑一片，保留了细节。软阴影计算算法该算法基于SDF光线步进（SDF Ray Marching）的一种非常经典且高效的方法，其核心思想由图形学大神 Inigo Quilez 提出。它不像传统阴影那样只判断“是”或“否”（完全遮挡或完全无遮挡），而是计算一个0.0到1.0之间的遮挡系数，从而模拟出柔和的半影（Penumbra）区域。 softShadow 函数： // ro: 光线起点 (物体表面上的点) // rd: 光线方向 (从该点射向光源的方向) // mint, maxt: 步进的最小和最大距离 // k: 一个关键参数，用于控制阴影的柔和度 float softShadow(vec3 ro, vec3 rd, float mint, float maxt, float k) { float res = 1.0; // 结果初始化为1.0，代表完全光亮 float t = mint; // t 是当前沿着光线方向步进的距离 // 循环步进，从表面点向光源前进 for (int i = 0; i < 64; i++) { // 计算当前点(ro + rd * t)到场景中最近物体的距离h float h = sceneSDF(ro + rd * t); // h极小，说明光线已经击中了某个物体，返回0.0（完全阴影） if (h < 0.0008) return 0.0; // --- 核心公式 --- res = min(res, k * h / t); // 更新步进距离t。步长是自适应的，但被clamp函数限制了范围 t += clamp(h, 0.002, 0.05); // 如果结果已足够精确或超出了最大距离，则停止 if (res < 0.004 || t > maxt) break; } // 将结果限制在[0, 1]范围内并返回 return clamp(res, 0.0, 1.0); } 核心公式：res = min(res, k * h / t) h: 当前光线上的点到最近遮挡物的距离。h 越小，意味着光线离遮挡物越近。 t: 光线从物体表面出发已经行进的距离。t 越小，意味着遮挡物离被着色的表面点越近。 h / t: 这个比率可以被理解为遮挡物相对于当前表面点的“视角大小”的近似。光线到遮挡物越近，阴影越明显(很好理解)，和h有正比关系。遮挡物到着色面越近，阴影过渡更硬，受到h的影响更大，1/t可以描述这种关系。 k: 这是一个硬度/柔和度系数。它像一个放大器，用来调整 h/t 的影响范围。k 值越大，k * h / t 的结果就越大，这意味着 res 更容易保持在较高的值（更亮），从而产生更大、更模糊、更柔和的阴影。反之，k 值越小，阴影就越小、越清晰、越硬。 min(res, ...): 在整个光线步进过程中，我们取所有计算出的遮挡值的最小值。这意味着阴影的暗度是由光线路径上最危险（离遮挡物最近）的那一刻决定的。设置步长带来的影响最开始的渲染结果如下：可以看到，阴影非常柔和/模糊：这是因为算法丢失了所有的细节。由于无法精确地找到物体的边缘，阴影的边界变得极不确定，只能形成一团模糊的、平均化的结果。并且阴影的过渡部分非常不自然，这种瑕疵是严重欠采样的典型表现。算法得到的数据是粗糙且不连续的。 ==当缩小步长：== 这一次阴影清晰、自然：由于采样精度足够高，算法能够准确地“感知”到遮挡物的边缘在哪里。因此，生成的阴影轮廓分明，半影的过渡也平滑且符合物理规律。第五步：最终组合最后，将漫反射、高光和阴影组合在一起，计算出主光源对最终颜色的总贡献。 vec3 lightColor = u.lightColors[0].rgb * u.lightColors[0].a; finalColor += (diff * albedo + spec * lightColor) * lightColor * shadow * u.lightDir.w; (diff * albedo + spec * lightColor): 这是光照的核心部分。将漫反射贡献（光与物体表面颜色互动）和高光贡献（光被直接反射）相加。 * lightColor: 乘以光源的颜色。 * shadow: 乘以阴影值。如果 shadow 值为 1，颜色不变；如果为 0.3，则颜色衰减为原来的30%。 * u.lightDir.w: 乘以光源的强度。 finalColor += ...: 将计算出的主光源贡献累加到最终颜色 finalColor上。填充光 (Fill Light)？首先，我们理解一下“填充光”在光照设计中的作用。在一个==经典的三点照明（Three-Point Lighting）系统==中，有三个主要光源：主光源 (Key Light)：最强的光，决定物体的基本形态和阴影(看上一节)。填充光 (Fill Light)：较弱的光，从主光源的另一侧照射物体，目的在于“填充”和柔化主光源制造出的浓重阴影，降低场景的对比度，让暗部的细节能够显现出来。边缘光 (Rim Light)：从物体背后打来的光，用于勾勒物体的轮廓，使其从背景中分离出来。因此，填充光的特点是：强度较弱、通常不产生高光、并且不投射自己独立的阴影。计算方法解析填充光的实现特点通过分析代码，我们可以总结出这个填充光的几个鲜明特点：仅有漫反射：它只计算了漫反射（diffuse），完全没有计算高光（specular）。这非常符合填充光的定位——只为照亮暗部，不制造新的亮点。不投射阴影：代码中没有为填充光调用 softShadow 函数。这也是一种常见且必要的优化，因为计算多光源的阴影成本非常高，而且通常只有主光源的阴影对场景的视觉贡献是必要的。强度较弱且固定：它的强度被一个固定的 0.6 系数削弱，明确了其作为次级光源的地位。边缘光边缘光，有时也叫“背光”（Backlight），是三点照明系统中的第三个光源，如上图所示。目的：它的主要作用不是照亮物体本身，而是勾勒出物体的轮廓。通过在物体的边缘形成一道亮边，可以将物体与深色的背景清晰地分离开来，极大地增强了场景的深度感和立体感。位置：通常放置在物体的斜后方，正对着相机。计算方法解析边缘光的计算利用了一个非常巧妙且高效的技巧，它甚至不需要一个实际的光源位置。它基于视角和表面法线之间的关系来模拟这个效果。我们来看 getLight 函数中对应的代码块： // 3. 边缘光 (Rim Light)，用于勾勒物体轮廓 if (u.enableLights.z == 1) { float rim = 1.0 - max(0.0, dot(viewDir, n)); rim = pow(rim, 3.0); finalColor += rim * u.lightColors[2].rgb * u.lightColors[2].a * 0.8; } 这个计算过程可以分解为以下几个步骤：步骤 1: 计算基础边缘强度 float rim = 1.0 - max(0.0, dot(viewDir, n)); dot(viewDir, n): 我们再次见到了这个点积运算。它计算的是视角方向 viewDir 和表面法线 n 之间夹角的余弦值。当你的视线正对着一个表面时（例如球体的正中心），viewDir 和 n 方向几乎重合，点积结果接近 1.0。当你的视线与表面近乎平行时（也就是你正在看物体的边缘/轮廓），viewDir 和 n 几乎互相垂直，点积结果接近 0.0。 1.0 - ...: 通过用 1.0 减去点积的结果，这个操作巧妙地将数值“反转”了：在物体中心，1.0 - 1.0 = 0.0。边缘光强度为0。在物体边缘，1.0 - 0.0 = 1.0。边缘光强度为1。这行代码实现的效果是：一个物体越是靠近其视觉上的轮廓，rim 的值就越大。这正是边缘光所需要的！这个技巧与我们之前讨论的菲涅尔效应的计算几乎完全一样，它们都依赖于视角和法线的关系。步骤 2: 调整边缘光的衰减 rim = pow(rim, 3.0); 上一步计算出的 rim 值是从边缘（1.0）到中心（0.0）线性变化的。直接使用这个值会导致边缘光范围太宽，过渡不够锐利。 pow(rim, 3.0): 通过对 rim 值进行幂运算（这里是3次方），可以收紧这个亮边的范围。因为 [0, 1] 之间的数字，其幂次越高，值就越小。例如，0.5^3 = 0.125。这个操作使得只有 rim 值非常接近 1.0 的区域（也就是最边缘的区域）才能保持较高的亮度，而稍微离开边缘一点，亮度就会迅速衰减下去。这就形成了一道更窄、更集中的亮边，效果更佳。步骤 3: 组合最终颜色 finalColor += rim * u.lightColors[2].rgb * u.lightColors[2].a * 0.8; rim * ...: 将计算出的边缘光强度 rim 乘以指定的边缘光颜色 u.lightColors[2].rgb 和强度 u.lightColors[2].a。 * 0.8: 额外再乘以一个 0.8 的系数，稍微降低一点边缘光的整体亮度。 finalColor += ...: 和填充光一样，将边缘光的颜色贡献累加到最终颜色上。边缘光的特点虚拟光源：它不依赖于一个明确的光源方向向量（如 fillDir 或 l），而是完全通过几何关系（视角和法线）来模拟，非常高效。依赖视角：效果是完全相对于观察者的。当你转动视角时，边缘光会一直出现在物体的轮廓上。高度可控：通过调整 pow 函数的指数，可以非常方便地控制亮边的宽度和锐利程度。指数越高，亮边越窄。纯粹的附加效果：和填充光一样，它没有高光，也不投射阴影，纯粹是为了增强视觉表现力而添加的颜色。环境光计算这里采用了一种非常简化的模型：当的眼睛看向物体表面时，==如果视线被反射向了“天空”==，就会在物体表面看到一抹来自天空的蓝色反光。这个反光在物体的边缘处以及正对着天空的表面上会最强。步骤：根据视线方向和法线方向计算视线反射方向。vec3 envReflect = reflect(-viewDir, n); 计算反射向量有多大程度指向天空，结合用菲涅尔效应计算最终的反射光。 ``` // 1. 计算反射方向指向天空的程度 float envAmount = max(0.0, envReflect.y) * fresnel; // 2. 添加环境光颜色 finalColor += envAmount * vec3(0.3, 0.5, 0.8) * 0.4; [[图形学八股总结#2. 基于图像的照明 (IBL)]] 这种方式是“基于图像的照明”方法的一种简化，采用==程序化的模拟生成简化天空==（一个半球），只模拟了天空的镜面反射和菲涅尔效应。 ## 思考一：shapMap和直接软阴影计算的区别 ### `softShadow` (基于光线步进) * **原理**：这是一种 “屏幕空间”方法。对于屏幕上每一个被渲染的像素点，它都会从这个点向光源方向发射一条“阴影光线”，并进行多次步进（Ray Marching）。通过在步进过程中检测离场景的最近距离，来判断这条路径上是否有遮挡物，并根据遮挡的紧密程度计算出阴影的柔和度。 * **特点**： * **逐像素计算**：每个需要计算阴影的像素都要执行一个循环（在你的代码里是64次），计算成本非常高。 * **高质量**：可以产生==非常精确、物理正确的柔和阴影==，阴影的柔和度会根据遮挡物和接收物之间的距离自然变化。 * **无额外内存**：不需要额外的显存来存储纹理。 * **与SDF渲染原生集成**：这是在SDF光线步进渲染器中实现阴影的最自然、最直接的方法。 ### Shadow Map (基于光栅化) * **原理**：这是一种“两遍渲染（Two-Pass）”的技术。 1. **第一遍 (深度图渲染)**：将相机移动到光源的位置，并朝光源的方向渲染整个场景。但这次渲染不输出颜色，只输出每个像素的**深度信息**（即距离光源的远近），并将这些信息存储在一张纹理中，这张纹理就是**Shadow Map**。 2. **第二遍 (最终场景渲染)**：从主相机的位置正常渲染场景。对于每个像素，将其坐标转换到光源的视角下，并查询第一遍生成的Shadow Map。通过比较当前像素的深度和Shadow Map中记录的深度，就可以判断出该像素是否在阴影中。 * **特点**： * * **速度快**：整个过程主要依赖于硬件高度优化的光栅化管线，渲染深度图通常非常快。最终着色时，只是多了一次纹理采样，计算成本远低于光线步进。 * **硬阴影**：基础的Shadow Map只能产生边缘锐利的**硬阴影**。要实现软阴影，需要额外的技术，如 **PCF** (Percentage-Closer Filtering) 或 **VSM** (Variance Shadow Maps)，这会增加一些计算成本，但通常仍比光线步进快。 * **依赖分辨率**：阴影的质量受Shadow Map纹理分辨率的限制，分辨率太低会导致阴影边缘出现锯齿（Aliasing）。 * **常见问题**：有可能会产生一些瑕疵，如“Shadow Acne”（阴影痤疮）和“Peter Panning”（物体悬浮）。 ## 思考二：菲涅尔效应和边缘光在上述介绍的光照计算方法中，菲涅尔效应系数的计算和边缘光的计算存在类似的地方： // 边缘光 float rim = 1.0 - max(0.0, dot(viewDir, n)); // 菲涅尔 fresnel = pow(1.0 - max(0.0, dot(viewDir, n)), 2.0); 但实际上，**这种方式只是对场景的一种简化**，边缘光可以认为是一种艺术效果，是为了更好的模拟物理场景，**只是这种物理场景的模拟方式恰好和菲涅尔系数的计算方法类似**。在该方法中，菲涅尔系数只被用于环境光的衰减,**严格意义上来说，这里并不能被称作菲涅尔系数。** ### PBR中的菲涅尔效应在基于物理的渲染（PBR）中，菲涅尔效应是其核心原则之一，它不再是一个可选的“艺术效果”，而是**精确描述光与物质相互作用、保证能量守恒的关键物理规律**。它的核心作用是：**根据视角，动态地决定进入材质的光线能量中有多少被镜面反射（Specular），有多少被折射并形成漫反射（Diffuse）。** ----- #### 1\. 核心公式：Schlick近似法(前面提到过) 在PBR中，精确计算菲涅尔方程非常复杂且耗时。因此，业界广泛采用由Christophe Schlick提出的近似公式： $$F(\theta) = F_0 + (1 - F_0) (1 - \cos\theta)^5$$ 我们来分解这个公式的每一个部分： * $F(\theta)$: **最终的菲涅尔反射率**。这是一个介于0和1之间的值（或RGB向量），代表在当前角度下，光线被镜面反射的比例。 * $F_0$: **基础反射率（Base Reflectivity）**。这是菲涅尔效应的**关键输入参数**，代表当视线**垂直于**表面时（即 $\theta = 0$）的反射率。这个值是**材质的固有属性**。 * $\\cos\\theta$: 视角与法线（或半角向量）夹角的余弦值。在PBR中，通常使用**半角向量 (h)** 和 **视角向量 (v)** 的点积来计算，即 $\cos\theta = \text{dot}(h, v)$。 * $(1 - \\cos\\theta)^5$: 这部分描述了反射率随角度变化的曲线。当视角从垂直（$\cos\theta \approx 1$）变为掠射角（$\\cos\\theta \\approx 0$）时，这一项的值从0迅速增长到1，使得最终的反射率 $F(\\theta)$ 趋近于1（即100%反射）。 $F\_0$ 的值取决于材质是**电介质（Dielectric，非金属）还是导体（Conductor，金属）**： * **非金属 (Dielectrics)**： * $F_0$ 通常是一个**很低且没有色彩的灰度值**。 * 大部分常见非金属的 $F\_0$ 值都非常接近，范围约在 **0.02 到 0.05** 之间。 * 因此，在PBR工作流中，非金属的 $F_0$ 经常被硬编码为一个**平均值 `vec3(0.04)`**。这个值是通过折射率（IOR）计算得出的：$F_0 = (\frac{IOR - 1}{IOR + 1})^2$。对于IOR为1.5的普通非金属，其$F_0$约等于0.04。 * **金属 (Metals)**： * $F_0$ 通常是一个**很高且带有色彩的RGB值**。 * 金属会吸收所有折射光，因此它们的漫反射颜色为黑色。我们看到的金属颜色，实际上就是它们**有色的镜面反射**。 * 在PBR的金属/粗糙度（Metallic/Roughness）**工作流中，金属的 $F_0$ 值通常就是它的**反照率（Albedo）贴图提供的颜色。在着色器代码中，我们可以这样动态计算 $F\_0$： ```glsl vec3 F0 = vec3(0.04); // 非金属的默认F0 F0 = mix(F0, albedo.rgb, metallic); // 如果是金属(metallic=1)，则用albedo颜色作为F0 2. PBR中的应用：能量守恒的“分配器” 现在我们知道了如何计算菲涅尔反射率 $F$，那么它在整个PBR光照模型中是如何使用的呢？ PBR将物体表面的光照分为两个部分：漫反射（Diffuse）和镜面反射（Specular）。渲染方程的简化形式（也称为反射方程）的BRDF（双向反射分布函数）部分可以概括为： \[f_{r} = k_d \cdot f_{\text{diffuse}} + k_s \cdot f_{\text{specular}}\] 这里的 $k_d$ 和 $k_s$ 分别是漫反射和镜面反射所占的能量比例。为了保证能量守恒（反射出去的光不能比入射的光更多），==这两个比例之和必须小于等于1。== 菲涅尔项 $F$ 在这里就扮演了镜面反射比例 $k_s$ 的角色！首先，我们使用Schlick近似法计算出当前角度的菲涅尔反射率 $F$。 // H: 半角向量, V: 视角向量, F0: 基础反射率 vec3 F = fresnelSchlick(max(dot(H, V), 0.0), F0); 这个 $F$ 值直接告诉我们：有多少比例的入射光能量被用于镜面反射。 $k_s = F$ 根据能量守恒，剩下的能量则被用于折射和漫反射。所以漫反射的能量比例就是： $k_d = 1 - k_s = vec3(1.0) - F$ 最终，我们将这两个部分组合起来，得到总的光照贡献： // NDF, G, F 是Cook-Torrance BRDF的三大核心部分 vec3 specular_part = NDF * G * F / (4.0 * dot(N, V) * dot(N, L) + 0.001); // 计算漫反射能量比例 kD vec3 kD = vec3(1.0) - F; // 如果是金属，没有漫反射 kD *= (1.0 - metallic); vec3 diffuse_part = kD * albedo / PI; // 最终颜色是漫反射和镜面反射的总和 vec3 finalColor = (diffuse_part + specular_part) * lightColor * dot(N, L); 3.补充Cook-Torrence BRDF的其他项对于PBR中的Cook-Torrance BRDF镜面反射部分，其核心思想是基于微表面理论（Microfacet Theory）。该理论假设，从宏观上看是粗糙的表面，在微观尺度上是由大量朝向各异的、平整的微小镜面（microfacet）组成的。表面的“粗糙度”（Roughness）参数，就决定了这些微小镜面的朝向混乱程度。 NDF 和 G 这两项就是用来从统计学上描述这些微表面的行为的。 1. NDF - 法线分布函数 (Normal Distribution Function) 核心作用：描述微表面的法线朝向集中度。简单来说，NDF回答了这样一个问题：“在所有微表面中，究竟有多少比例的微表面其法线正好对齐在了某个特定方向上？” 在Cook-Torrance模型中，我们最关心的方向是半程向量 (Halfway Vector, H)，即光线方向 L 和视线方向 V 的角平分线方向 (H = normalize(L + V))。因为只有当微表面的法线 m 正好等于 H 时，光线才能被完美地反射到观察者眼中。如果表面非常光滑 (Roughness → 0)：绝大多数微表面的法线都与宏观表面法线 N 一致。NDF函数会输出一个非常大（集中）的值当 H 接近 N 时，而在其他方向迅速衰减为0。这会形成一个非常小而亮的镜面高光。如果表面非常粗糙 (Roughness → 1)：微表面的法线朝向非常混乱。NDF函数在一个很宽的角度范围内都会有返回值，当 H 偏离 N 较远时，函数值衰减得也更慢。这会形成一个范围很广且更模糊的高光。常用计算模型：Trowbridge-Reitz GGX 这是目前实时渲染中最流行和效果最自然的模型。它的公式如下： \[NDF_{GGX}(N, H, \alpha) = \frac{\alpha^2}{\pi((N \cdot H)^2(\alpha^2 - 1) + 1)^2}\] $N$: 宏观表面的法线。 $H$: 半程向量。 $\alpha$: 代表表面粗糙度的参数，通常由 roughness 参数计算而来：$\alpha = \text{roughness} \times \text{roughness}$。在Shader中实现： // NDF (Trowbridge-Reitz GGX) float DistributionGGX(vec3 N, vec3 H, float roughness) { float a = roughness * roughness; float a2 = a * a; float NdotH = max(dot(N, H), 0.0); float NdotH2 = NdotH * NdotH; float denom = (NdotH2 * (a2 - 1.0) + 1.0); denom = PI * denom * denom; return a2 / denom; } 2. G - 几何函数 (Geometry Function) 核心作用：描述微表面的自遮挡属性。几何函数模拟了微表面之间的相互遮挡和阴影。即使某个微表面的法线正好对齐了半程向量 H，它也可能因为以下两种原因而无法贡献光照：遮蔽 (Masking)：从观察者视线方向 V 看去，这个微表面被其他微表面挡住了。阴影 (Shadowing)：从光源方向 L 看去，这个微表面处于其他微表面投下的阴影中。当视线或光线接近掠射角（grazing angles，即与表面近乎平行）时，这种遮挡效应会变得非常明显，导致镜面反射急剧减弱。 G 函数的取值范围是 [0, 1]，0代表完全遮挡，1代表完全无遮挡。常用计算模型：Schlick-GGX (Smith’s Method的近似) 为了高效计算，通常使用Schlick对Smith’s Method的近似模型。它将几何函数分为视线和光源两个方向的项，然后相乘： \[G(N, V, L, k) = G_1(N, V, k) \cdot G_1(N, L, k)\] 其中 $G_1$ 的计算公式为： \[G_1(v, k) = \frac{N \cdot v}{(N \cdot v)(1 - k) + k}\] $v$: 代表视线向量 V 或光源向量 L。 $k$: 是一个基于粗糙度 $\alpha$ 计算的参数。对于直接光照，通常使用：$k = \frac{(\alpha + 1)^2}{8}$。在Shader中实现： // Geometry Function (Schlick-GGX) float GeometrySchlickGGX(float NdotV, float roughness) { // k for direct lighting float r = roughness + 1.0; float k = (r * r) / 8.0; float num = NdotV; float den = NdotV * (1.0 - k) + k; return num / den; } // Smith's Method float GeometrySmith(vec3 N, vec3 V, vec3 L, float roughness) { float NdotV = max(dot(N, V), 0.0); float NdotL = max(dot(N, L), 0.0); float ggx_V = GeometrySchlickGGX(NdotV, roughness); float ggx_L = GeometrySchlickGGX(NdotL, roughness); return ggx_V * ggx_L; } NDF (法线分布)：决定了高光的形状、大小和锐利度。粗糙度越高，高光越弥散。 G (几何遮挡)：决定了高光的能量损失。在掠射角时，它会衰减高光的强度，以模拟微观层面的自遮挡，这是保证PBR能量守恒的重要一环。箱子场景软阴影bug 观察到SDF软阴影在阴影过渡区域存在不自然的过渡区域，例如墙壁上本来的阴影和球体阴影之前的过渡。该现象可以通过减少ray march的步长解决，当ray march的步长过大时，采样率低，无法得到精确的物理近似。

3D SDF · 2025-08-12

Calendar's Blog

Contact

3D SDF